رتبه بندی موجودیت در وب داده

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی
author هادی خسروی فارسانی
adviser محمدعلی نعمت بخش
Number of pages: First 15 pages
publication year 1391

abstract

امروزه، موتورهای جستجو به یکی از برنامه های کاربردی بسیار مهمِ وب تبدیل شده اند که هدف آن ها کمک به کاربر در جهت یافتن اطلاعات است. موتورهای جستجو همچون گوگل و یاهو کلمات کلیدی کاربر را دریافت می کنند و در صفحات وب بر اساس الگوریتم های از قبل تعریف شده به دنبال کلمات کلیدی وارد شده می گردند. سپس صفحات بازیابی شده را بر اساس الگوریتم رتبه بندی، مرتب و به کاربر نشان می دهند. با ظهور فناوری وب معنایی، نیاز به الگوریتم های متناسب با این فناوری برای رتبه بندی داده ها بیش از پیش ضروری به نظر می رسد. در این پایان نامه روشی برای رتبه بندی داده ها در داده های پیوندی پیشنهاد شده است. در ابتدا، الگوریتم pagerank توسعه داده شده است و مجموعه های داده رتبه بندی شده اند. سپس، رتبه موجودیت ها در میان موجودیت های مشابه محاسبه می شود. رتبه بندی مجموعه های داده در داده های پیوندی با ایجاد یک گراف جهت دار که گره های آن، مجموعه های داده و پیوندهای آن، تعمیم پیوند بین موجودیت ها به پیوند بین مجموعه های داده است محاسبه می شود. الگوریتم رتبه بندی pagerank بر روی گرافِ ساخته شده اعمال می شود و رتبه گره ها یا همان مجموعه های داده بدست خواهد آمد. رتبه موجودیت های درون مجموعه های داده نیز با استفاده از همان pagerank به صورت جداگانه برای هر موجودیت محاسبه می شود. رتبه نهایی یک موجودیت، برابر است با مجموع رتبه مجموعه داده هایی که به این موجودیت استناد کرده اند. ارزیابی ها نشان دهنده کارایی و دقت بالاتر روش پیشنهادی نسبت به روش pagerank است. رتبه بندی موجودیت های مشابه با استفاده از الگوریتم های خوشه بندی محاسبه شده است. دو روش خوشه بندی در این پایان نامه ارائه شده است. روش اول تنها از ساختار پیوند بین موجودیت ها استفاده می کند و روش دوم همزمان از ساختار پیوند و داده های مربوط به خصوصیت های موجودیت ها استفاده می کند. هر دو روش پیشنهادی برای خوشه بندی موجودیت ها نسبت به کارهای مشابه دارای دقت و سرعت بالاتری هستند. نهایتاً، رتبه گره ها درون مجموعه های داده حوزه ای با استفاده از pagerank محاسبه شده است. ارزیابی رتبه موجودیت با نظر متخصصین در فضای غیر مجازی نشان دهنده چیدمان درست موجودیت ها است.

Already have an account?login

similar resources

شناسایی موجودیت های همانند در وب داده

وب داده به منظور ایجاد وب قابل فهم برای ماشین ها معرفی شده است که اتصالات معنادار بین موجودیت ها از ویژگی های اصلی آن است. یکی از مهم ترین اتصالات معنادار در وب داده، اتصالات همانندی است که بین موجودیت های همانند ایجاد می شود. شناسایی و اتصال موجودیت هایی که به یک موجودیت یکسان اشاره می کنند ولی دارای شناسه های یکتای منبع متفاوت هستند و در مجموعه داده های مختلفی قرار دارند، موجب می شود عامل ها ...

15 صفحه اول

خوشه بندی موجودیت ها در داده های پیوندی

وب معنایی شامل قرار دادن داده ها روی وب و ساختن ارتباطات به گونه ای است که انسان و ماشین بتوانند محتوای وب داده را کاوش نمایند. هدف وب معنایی افزایش توانایی ماشین ها در دسترسی به منابع موجود در وب، پردازش و بکارگیری آن ها می باشد. با توجه به رشد گسترده ی داده های پیوندی و افزایش مجموعه داده ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می شود. ابزارهای کنونی برای کشف پیو...

15 صفحه اول

رفع اختلاف مقادیر داده ای میان موجودیت های همانند در وب داده ها

وب داده های پیوندی به سرعت در حال گسترش می باشد و در حال حاضر شامل داده هایی از صدها مجموعه داده ی متفاوت می باشد. کیفیت داده های این مجموعه داده ها بسیار متغیر است، به طوریکه ممکن است این داده ها قدیمی، ناقص و یا نادرست باشند. از طرف دیگر امکان دارد مجموعه داده ها اطلاعات متناقضی درمورد یک موجودیت واحد در جهان واقعی ارائه کنند. به منظور استفاده ی برنامه های کاربردی داده های پیوندی از این فضای...

15 صفحه اول

رتبه بندی تحلیل پوششی داده های فازی برمبنای داده های آماری و فاصله اطمینان آماری

full text

رتبه بندی وب‌سایت‌های دانشکده های داروسازی ایران با استفاده از ضریب تاثیرگذار وب

Introduction: Considering the importance of websites in informing users and establishing communications, universities have started to design their own websites for organizing and making their information accessible. Evaluation of these websites through webometric methods will help recognize pitfall and strong points to reach a better quality and constant improvement. This study was aimed...

full text

رتبه بندی و تحلیل حساسیت رتبه های واحدهای تصمیم گیرنده در تحلیل پوششی داده ها بر مبنای ابرصفحه ایده آل

There are many methods for ranking of DMUs. Some of the previous proposed methods may be infeasible and the others cannot rank all DMUs. In this paper,we introduce a new method for ranking of DMUs that is always feasible and can be usd all ranking of all DMUs. the rank of DMUs is acheived based on the ideal hyperplan. The sensitivity of the rank is presented as well. Therefore, in this study, a...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی

Keywords

وب معنایی داده های پیوندی خوشه بندی موتور جستجو

Hosted on Doprax cloud platform doprax.com